Meta-reinforcement learning via orbitofrontal cortex

Meta-reinforcement learning via orbitofrontal cortex | Nature (2023)

Ryoma Hattori, Nathan G. Hedrick, Anant Jain, Shuqi Chen, Hanjia You, Mariko Hattori, Jun-Hyeok Choi, Byung Kook Lim, Ryohei Yasuda & Takaki Komiyama

hl.icon

我々は何か新しいものを学習するときでも、昔の経験を活かしてうまく学習することができる

Naa_tsure.iconプログラミングに慣れていると、新しいプログラミング言語が発表されても素早く学習することができたりする

メタ強化学習(Meta RL)の実装として、異なる時間スケールごとに以下のメカニズムを想定することができる

早い時間スケール：神経活動のリカレントダイナミクス

Naa_tsure.iconシナプスの強度が変化→ネットワークのダイナミクスが変化

しかし、実際の動物の脳内で異なる時間スケールの学習がおこなわれているかは不明

そこで、この研究では深層強化学習(Deep RL)とマウス(mouse)の脳を対象にこれを検証した